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fi 2: [目的 / 意义 ] 综 合 表征 学 术 期 刊 传播 、 影 响 、 知 识 与 信息 量 的 指标 缺乏 ， 本 文 提出 下 载 因子 指标 以 弥补 这 个 问题 。 
[方法 / 过 程 ] 首 先 根据 下 载 频次 与 被 引 频 次 的 历年 变化 ， 基 于 图 书馆 情报 与 文献 学 CSSCI 期 刊 中 国 知 网 引文 数据 ， 采 用 面板 
数据 模型 建立 下 载 频次 与 被 引 频 次 预测 模型 ， 确 定 设计 下 载 因 子 的 最 佳 沾 后 期 ， 提 出 下 载 因子 指标 ， 即 期 刊 论文 发 表 2 年 
平均 每 篇 论文 的 下 载 次 数 除 以 100。 继 续 采 用 岭 回 归 分 析 下 载 因子 与 影响 因子 、h 指数 、 载 文 量 的 关系 。[ 结 果 / Bill it 
1 年 和 2 年 下 载 频次 决定 了 被 引 频 次 的 80%; 下 载 因子 可 以 较 好 测度 期 刊 的 知识 信息 量 、 传 播 水 平 、 影 响 力 和 学 术 质 量 ; 下 载 
因子 指标 有 待 更 多 学 科 和 数据 的 检验 。 
关键 词 : 下 载 因 子 ; 传播 水 平 ; 滞后 期 ; 评价 指标 
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管 GARFIELD tfr 1996 年 就 提出 了 利用 下 载 频次 代 
替 被 引 频次 指标 以 解决 引文 分 析 评 价 中 的 滞后 性 问题 
的 思想 ， 但 这 方面 的 进展 非常 缓慢 ， 即 使 是 非常 简明 

互联 网 的 诞生 给 文献 计量 学 带 来 了 革命 性 的 影响 ， ”扼要 的 指标 也 比较 缺乏 ， 其 中 最 典型 的 就 是 篇 均 下 载 
催生 了 一 批 学 术 文献 的 网 络 下 载 指 标 。 其 中 最 具有 代 ”频次 ,但 即使 这 个 指标 学 术 界 也 涉及 较 少 ,缺乏 深度 
表 性 的 基础 指标 就 是 下 载 频 次 ， 此 外 还 包括 Web 即 年 p A 
下 载 率 、 总 下 载 量 、 下 载 量 半 训 期、 谷歌 学 者 指数 等 ，“ 大 量 问题 需要 进一步 研究 : 下 载 频次 与 被 引 频次 是 什 
这 些 指标 的 提出 提供 了 一 种 新 的 衡量 学 术 传播 和 影响 |o uin x SAI 
力 的 方法 与 手段 ， 大 大 发 展 了 传统 的 文献 计量 学 ， 并 ”跨度 的 下 载 频次 来 构造 相关 评价 指标 合适 ”如 何 构造 
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且 也 是 替代 计量 学 (Altmetrics) 的 重要 组 成 部 分 。 下 次 频次 相关 评价 指标 ? 如 何 测度 新 指标 的 信息 量 ? 
目前 关于 下 载 频次 的 相关 指标 研究 还 不 充分 。 新 指标 的 统计 特征 如 何 ? 评价 中 如 何 应 用 等 ， 有 必要 


收 稿 日 期 : 2023-10-07 

基金 项 目 : 国家 社 科 基金 “学 术 期 刊 评价 一 一 指标 创新 与 方法 研究 ” (21FTQB016) ; 浙江 省 自然 科学 基金 重点 项 目 “ 制 造 业 从 数量 型 创新 
名 质量 型 创新 转型 机 制 研究 ” (Z21G030004) 

作者 简介 : AZF (1967- )， 男 ,博士 , 教授， 博导， 研究 方向 为 技术 经 济 、 科 技 评价 领域 的 研究 


= 


2023 年 第 35 卷 第 11 期 NAM 


78 


农业 图 书 情报 学 报 


DOI, 10.13998/j.cnki.issn1002-1248.23-0757 


对 这 些 问 题 进行 深入 分 析 。 

构造 基于 传播 与 影响 力 兼 顾 的 评价 指标 十 分 重要 ， 
目前 这 方面 指标 总 体 比较 缺乏 。 传 播 和 影响 力 是 学 术 
期 刊 的 两 大 重要 标志 ， 下 载 频 次 属于 侧重 传播 的 指标 ， 
被 引 频次 属于 侧重 影响 力 的 指标 ， 如 果 能 同时 从 这 两 
个 角度 评价 非常 上 必要， 当然 如 果 设 计 的 新 指标 还 能 一 
定 程度 上 衡量 学 术 期 刊 的 质量 、 知 识 和 信息 量 就 更 加 
完美 了 。 相 关 研 究 在 理论 上 可 以 丰富 文献 计量 学 ， 提 
供 了 一 个 新 的 评价 指标 ， 在 实践 中 可 直接 采用 该 指标 
评价 学 术 期 刊 的 传播 、 影 响 力 等 综合 表现 ， 从 而 提供 
了 一 种 新 的 技术 手段 。 

关于 论文 相关 的 直接 下 载 指标 ， 目 前 中 国 公 布 了 
两 个 相关 指标 ， 一 个 是 Web 即 年 下 载 率 ， 是 指 统计 年 
度 某 期 刊 在 中 国 知 网 发 布 的 文献 被 当年 全 文 下 载 的 总 
次 数 与 期 刊 论文 总 数 之 比 。 另 一 个 是 总 下 载 量 ， 某 期 
刊 发 布 在 中 国 知 网 的 所 有 论文 在 统计 年 被 全 文 下 载 的 
总 篇 次 。 刘 雪 立 根据 期 刊 引 用 半衰期 和 被 引 半 衰 期 概 
念 建立 了 期 刊 下 载 量 半衰期 。 许 新 军 B 实 证 得 出 期 刊 下 
载 量 半衰期 明显 小 于 被 引 半 衰 期 和 引用 半衰期 ， 与 被 
引 半 豪 期 之 间 存 在 显著 的 相关 性 。 王 超 等 所 人 为 论文 下 
载 量 分 布 可 以 反映 相关 学 科 文 献 的 网 络 传播 特征 ， 提 
出 最 可 及 下 载 量 代表 指标 ， 用 来 反映 学 科 论 文 的 下 载 
ET. 

关于 下 载 指标 的 特点 与 应 用 ，HARYB 认 为 下 载 指 
标 具 有 和 引文 指标 同样 的 识别 重大 科学 发 展 的 作用 。 
苏 新 宁 四 指出 下 载 行为 源 于 关键 词 检索 ， 被 下 载 次 数 多 
的 期 刊 说 明 其 关键 词 比较 规范 ， 主 题 更 贴近 当前 学 者 
关注 的 问题 。 关 于 下 载 指 标的 影响 因素 ， 丁 体 奇 等 " 实 
证 显示 网 络 下 载 近 2 年 比重 较 高 ， 专 栏 及 综述 下 载 率 
高 ， 人 研究 性 论文 引用 率 高 。DANIELS 提 出 下 载 和 引文 
关联 模型 ， 指 出 文献 下 载 受 读者 兴趣 、 文 献 可 见 性 和 
成 熟 度 等 的 影响 。 谢 娟 和 八 凯 乐 吕 人 为 论文 质量 、 引 证 
时 间 窗 、 下 载 时 间 窗 及 下 载 数据 源 对 下 载 与 被 引 关 系 
具有 影响 。 

关于 下 载 相关 指标 与 其 他 指标 的 关系 ， 从 横向 更 
态 关 系 看 ，BOTTING 等 (发现 论文 发 表 年 内 下 载 量 可 
以 预测 今后 3 年 后 的 被 引 情况 ， 拟 合 优 度 为 0.450。 
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SCHLOGL 等 研究 发 现 ， 图 书 情报 学 领域 论文 的 下 载 
次 数 与 被 引 次 数 相关 程度 较 高 ， 相 关系 数 达 到 0.770。 
胡 敏 中 认 为 从 期 刊 层 次 考察 ， 不 同期 刊 的 网 络 总 下 载 
量 与 总 被 引 量 为 高 度 线性 相关 ， 网 络 篇 均 下 载 量 与 篇 
均 被 引 量 的 线性 相关 性 更 强 。 赵 一 权 等 中 研究 结果 显 
示 计 算 机 科学 技术 领域 中 ， 无 论 是 在 期 刊 层 次 ， 还 是 
在 文献 层次 ， 被 引 次 数 和 下 载 次 数 都 具有 较 强 的 正 相 
关 性 。 从 时 间 趋 势 看 ，BRODY 等 的 研究 显示 ， 论 文 
的 被 下 载 次 数 对 将 来 引用 次 数 有 积极 影响 。 牛 昱 昕 等 中 
对 开放 存 取 论文 的 研究 发 现 ， 从 长 期 看 下 载 频 次 与 被 
引 频次 之 间 呈 现 正 相 关 趋 势 。 熊 泽 泉 和 有 段 宇 锋 史 研究 
认为 ， 累 积 下 载 量 与 累积 被 引 量 存在 线性 相关 性 ， 且 
两 者 相关 性 随时 间 的 增长 而 增强 。 

还 有 一 些 研究 从 更 广泛 的 角度 分 析 了 下 载 指标 与 
其 他 指标 的 关系 ， 得 出 了 一 些 独到 的 结论 。ANDREW 
等 四 对 International Journal of Cardiology 期 刊 下 载 频次 
和 被 引 频 次 最 高 的 前 25 篇 论文 进行 比较 ， 发 现 被 引 频 
次 与 下 载 频 次 并 无 显著 关系 。 朱 走 等 外 发 现 理 、 工 、 
农 、 医 类 期 刊 下 载 频次 与 被 引 频 次 的 相关 性 高 于 经 济 、 
人 文 、 社 会 科学 类 期 刊 。 陆 伟 等 中 实证 发 现下 载 频 次 
与 被 引 频 次 的 相关 性 在 不 同情 况 有 较 大 差异 ， 单 篇 论 
文 下 相关 性 不 强 ， 作 者 下 呈 二 次 函数 相关 ， 而 期 刊 下 
呈 三 次 函数 相关 。 

从 现 有 的 研究 看 ， 学 术 界 较 早 意识 的 下 载 频次 的 
重要 性 ， 并 对 该 指标 进行 了 大 量 的 研究 ， 也 诞生 了 几 
个 直接 与 下 载 频次 相关 的 新 指标 。 关 于 下 载 频 次 指标 
的 特点 、 评 价 内 容 、 关 注 点 等 研究 比较 充分 ， 较 多 研 
究 分 析 了 下 载 频次 与 被 引 频次 的 关系 ， 总 体 上 多 数 研 
究 认为 下 载 频次 与 被 引 频次 相关 ， 同 时 学 术 界 也 注意 
到 下 载 频 次 与 被 引 频次 关系 的 复杂 性 。 总 体 上 在 以 下 
方面 有 待 深入 研究 。 

(1) 尽管 下 载 频次 比 引用 频次 拥有 更 好 的 时 效 性 ， 
但 采用 多 长 时 间 跨 度 的 下 载 频次 来 进行 评价 缺乏 讨论 ， 
太 长 的 时 间 跨 度 使 得 评价 没有 时 效 性 ， 太 短 的 时 间 跨 
度数 据 会 导致 数据 不 完全 从 而 没有 评价 效果 ， 有 必要 
进行 全 面 的 数据 分 析 后 做 出 判断 。 

(2) 在 特定 时 间 跨 度 内 的 下 载 频次 ， 其 与 被 引 频 
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次 的 关系 如 何 ? 或 者 换个 角度 ， 某 年 的 被 引 频 次 数据 
主要 受 哪 几 年 下 载 频 次 的 影响 ?这 种 影响 对 构造 新 的 
评价 指标 有 何 影响 ? 这 也 是 需要 进行 深度 计量 分 析 。 
现 有 研究 往往 采用 画图 法 、 相 关系 数 法 、 回 归 法 ， 不 
足以 得 出 有 效 的 结论 。 

(3) 从 深度 挖掘 下 载 频 次 应 用 指标 入 手 ， 新 指标 
与 影响 力 、 传 播 水 平 、 学 术 质 量 、 知 识 和 信息 量 等 有 
什么 关系 ? 也 需要 进行 进一步 的 分 析 。 

(4) 基于 下 载 频 次 构造 的 新 的 评价 指标 ， 其 统计 
学 特征 如 何 ? 对 评价 有 什么 影响 ? 


2 基本 数据 分 析 


2.1 研究 数据 


本 文 以 图 书馆 情报 与 文献 学 CSSCI 期 刊 为 研究 对 
象 (共有 20 种 期 刊 )， 基 于 中 国 知 网 的 引文 数据 库 来 
进行 研究 ， 首 先进 行 基础 数据 分 析 ， 进 而 为 构造 新 的 
评价 指标 打下 基础 。 考 虑 到 论文 下 载 频 次 与 被 引 频 次 
之 间 存 在 一 定时 间 的 数据 滞后 ， 因 此 载 文 量 数据 选择 
2015 年 ， 下 载 次 数 和 被 引 次 数 为 2015 一 2021 年 。 需 要 
说 明 的 是 ， 由 于 《情报 学 报 》 部 分 年 度 存 在 数据 缺失 ， 
因此 舍弃 了 该 指标 。 


2.2 学 科 下 载 频 次 与 被 引 频次 历年 变化 


整个 图 书馆 情报 与 文献 学 2015 年 发 表 论文 的 历年 
下 载 频 次 与 被 引 频 次 如 图 1 所 示 。 下 载 频次 在 论文 发 
表 后 第 一 年 达到 峰值 ， 随 后 缓慢 衰减 ， 而 被 引 频 次 在 
论文 发 表 后 第 二 年 达到 峰值 ， 第 三 年 略 有 下 降 ， 随 后 


2.3 被 引 频 次 与 下 载 频 次 滞后 关系 


大 量 研究 认为 被 引 频次 滞后 于 下 载 频 次 1~3 年 ， 
但 这 只 是 一 种 经 验 佑 计 ， 较 少 有 研究 十 分 规范 地 分 析 
这 个 问题 。 本 文 基 于 面板 数据 模型 进行 估计 ， 其 中 一 
个 重要 的 原因 是 ， 采 用 下 载 频 次 固然 是 被 引 频 次 的 重 
影响 因素 ， 但 被 引 频 次 的 影响 因素 太 多 了 ， 由 于 数 
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Fig.1 The download frequency and citation frequency of 


disciplines over the years 


据 所 限 ， 难 以 找到 所 有 变量 ， 在 这 种 情况 下 ， 采 用 传 
统 回归 进行 估计 就 是 有 偏 的 ， 但 面板 数据 中 的 固定 效 
应 模型 由 于 采用 了 差分 估计 法 ， 使 得 对 遗失 重要 变量 
不 敏感 ， 从 而 可 以 更 好 地 估计 下 载 频次 与 被 引 频 次 的 
关系 。 

分 析 下 载 频次 与 被 引 频 次 的 关系 必须 充分 考虑 滞 
后 期 ， 最 后 根据 统计 检验 值 是 否 显著 来 进行 综合 确定 。 
由 于 一 些 期 刊 出 版 周期 延长 ， 因 此 本 文 考虑 可 能 的 灌 
后 期 为 1~5 年 ， 基 本 模型 如 下 : 

Y =c + X(-1) Bi + X(-2) p2 + X(-3) Bs X(-4) Ba + 

X(-5) Bs + mi (1) 

公式 (1) P, Y APS MIR, XCD, XED, 

X(C3)、X(C4) 、XC5) 分 别 表 示 下 载 频次 的 1 年 、 2 年 、3 

4E. 448, 54E PRK HG, Bi, Bo, Bs, Ba Bs 分 
别 为 各 自 的 回归 系数 。 

面板 模型 的 估计 结果 如 表 1 所 示 ， 首 先 采 用 1-5 
年 滞后 期 进行 估计 ， 先 采用 随机 效应 模型 ， 然 后 进行 
Hausman 检验 ， 卡 方 值 为 27.323， 相 伴 概 率 为 0.000, 
拒绝 随机 效应 的 原 假设 ,采用 固定 效应 模型 进行 估计。 
估计 结果 中 ，4 年 滞后 期 和 5 年 滞后 期 回归 系数 为 负 
数 ，3 年 滞后 期 没有 通过 统计 检验 ， 明 显 不 符合 实际 情 
况 ， 因 此 选择 1~5 年 滞后 期 是 不 合适 的 。 

继续 采用 1-4 年 滞后 期 进行 估计 ， 最 终 采 用 固定 
效应 模型 ， 所 有 不 同 滞后 期 的 下 载 频次 均 通 过 了 统计 
仿 验 ， 并 且 是 正 数 。 模 型 的 拟 合 优 度 R 较 高 ， 为 
0.995， 远 远大 于 其 他 学 者 的 预测 精度 ， 说 明 该 模型 是 
非常 合适 的 ， 主 要 原因 由 于 目前 的 出 版 周期 较 长 ， 使 
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表 1 面板 数据 估计 结果 


Table 1 The results ofpanel data estimation 


变量 说 明 司 定 效应 司 定 效应 
c 常数 项 -11.427™ -8.561" 
(-6.580) (-13.992) 
In[X(-1)] 下 载 次 数 滞后 1 年 1.1737 0.380" 
(7.690) (3.239) 
In[X(2)] 载 次 数 滞后 2 年 0.629™™ 0.7877 
(3.340) (11.584) 
In[X(-3)] 载 次 数 滞后 3 年 0.138 0.190” 
(0.469) (1.891) 
In[X(-4)] 载 次 数 滞后 4 年 -0.447" 0.101” 
(-2.543) (2.330) 
In[X(-5)] 载 次 数 滞后 5 年 -0.204* 
(2.022) 
hausman hausman 检验 值 27.523 10.089 
p tH 相伴 概率 0.000 0.039 
R 拟 合 优 度 0.998 0.995 


"dE. *Q2099. 999 分 别 表示 在 10% 、5% 、1% 的 水 平 下 通过 统计 检验 


得 少数 论文 存在 较 长 时 间 的 滞后 。 回 归结 果 显 示 ，2 年 
沾 后 期 下 载 频次 对 被 引 频次 的 弹性 系数 最 大 ， 为 
0.787， 其 次 是 1 年 滞后 期 的 下 载 频次 ， 弹 性 系数 为 
0.380， 第 三 是 3 年 滞后 期 下 载 频次 ， 弹 性 系数 为 
0.190， 最 后 为 4 年 滞后 期 的 下 载 频次 ， 弹 性 系数 为 
0.101。 将 弹性 系数 转换 为 百分比 ，1 年 和 2 年 滞后 期 
下 载 频次 占 80.04%。 


3 下 载 因子 指标 的 构建 及 特征 分 析 


3.1 下 载 因 子 确定 时 间 窗 口 选取 


在 学 术 期 刊 评 价 中 ,评价 指标 的 时 效 性 非常 重要 。 
由 于 引文 规律 ， 使 得 被 引 频次 尚未 达到 极 大 值 来 构建 
指标 ， 即 使 时 效 性 好 也 明显 是 不 合理 的 ， 但 如 果 充 分 
考虑 引文 规律 ， 导 致 滞后 期 过 长 ， 丧 失 评价 的 时 效 性 
岂 不 合理 。 从 图 1 可 以 看 出 ， 被 引 高 峰 是 期 刊 论文 发 
表 后 2 年， 影响 因子 的 设计 是 非常 科学 的 ， 尽 管 部 分 
期 刊 的 被 引 高 峰 是 请 后 3 年 。 再 看 下 载 高 峰 ， 是 论文 
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发 表 后 1 年 ， 如 果 只 考虑 这 个 因素 ， 采 用 1 年 作为 时 
间 跨 度 是 最 好 的 ， 拥 有 比 影响 因子 更 好 的 时 效 性 。 

从 面板 数据 的 回归 结果 看 ， 沸 后 2 年 的 下 载 频次 
rgo DACH SE Wig A, Pin 1 年 的 下 载 频次 对 被 引 
频次 的 影响 次 之 。 综 合 以 上 两 个 因素 考虑 ， 最 终 决 定 
采用 2 年 滞后 期 来 构造 下 载 因子 指标 。 


3.2 下 载 因子 的 构造 


基于 影响 因子 指标 的 设计 原理 来 构造 下 载 因子 DF 
(Download Factor) ， 下 载 因子 就 是 期 刊 论文 发 表 后 两 
年 平均 每 篇 论文 的 每 百 次 累计 下 载 次 数 ， 用 公式 表示 
WUE 


DF 


= D,+D, +D, 


2 
100P,; (2) 


式 (2) 中 ， t 为 统计 年 度 ， D,、 Di Dy. 分 别 表示 
统计 年 度 、 去 年 、 前 年 的 下 载 频 次 ， 已 : 为 前 年 的 可 被 


引文 献 量 ， 分 母 除 以 100 是 为 了 降低 下 载 因子 值 的 大 
小 ， 更 符合 人 们 的 习惯 。 

下 载 因子 具有 以 下 特点 。 

(1) 从 评价 时 效 性 看 ， 与 影响 因子 同步 ， 均 为 期 
刊 发 表 论 文 后 2 年。 


(2) 下 载 因子 采用 可 被 引文 献 量 来 进行 计算 ， 同 
样 侧重 学 术 传播 和 学 术 影响 ， 删 除了 与 引证 计量 评价 
无 关 的 文献 ， 包 括 科普 资料 、 介 绍 、 令 事 抒 情 、 摘 译 、 
摘登 、 转 载 、 题 要 、 通 知 、 信 息 、 资 讯 、 导 读 、 启 事 ， 
刊 首 语 等 。 

(3) 为 了 使 得 下 载 因子 具有 可 读 性 ， 适当 降 低 了 
其 数量 级 。 


3.3 下 载 因子 的 内 酒 分 析 


下 载 因子 的 内 涵 如 图 2 所 示 。 首 先期 刊 论文 的 知 
识 和 信息 量 是 下 载 行为 的 原动力 ， 它 决定 了 下 载 ， 是 
学 术 传 播 的 重要 体现 。 下 载 频次 也 决定 了 论文 的 影响 
力 ， 所 以 下 载 因子 的 内 涵 首 先是 学 术 传播 ， 并 且 与 知 
识 信息 量 和 学 术 影 响 力 相关 ， 表 征 知识 信息 量 的 典型 
指标 就 是 载 文 量 ， 表 征 学 术 影 响 力 的 典型 指标 是 影响 
因子 和 指数， 不 过 影响 因子 通常 代表 一 般 影响 力 ， 


TRAST: 传播、 影响、 知识 与 信息 量 的 综合 指标 


知识 信息 量 


高 水 平 影响 力 


一 般 影响 力 


图 2 下 载 因子 的 信息 含量 


Fig. 2 The information content of download factors 


MLF 
提高 文献 计量 指标 时 效 性 新 的 尝试 


影响 因子 也 是 如 此 ， 因 此 计算 指数 时 也 必须 根据 统 
计 年 度 的 前 3 年 被 引 频次 进行 计算 ， 至 于 载 文 量 ， 是 
统计 年 度 前 第 三 年 的 数据 。 


4 下 载 因子 的 计算 及 实证 结果 


4.1 下 载 因子 的 计算 结果 


下 载 因子 的 计算 结果 如 表 2 所 示 ， 排 在 前 面 的 期 
刊 包括 《图 书 情 报 工 作 》《 人 情报 杂志 》《 情 报 科 学 》 


而 指数 代表 了 高 水 平 影响 力 ， 与 学 术 质 量 相 关 。 因 


此 基于 以 下 模型 研究 下 载 因子 的 内 涵 组 成 : 
log(DF)= c+alog(H)+a,log(IF)+a,log(P) +u — (3) 
公式 (3) 中, HON hdi, IF AAS, PON 
载 文 量 , u 为 随机 误差 项 ，w 、o、o 为 回归 系数 。 
需要 说 明 的 是 ， 分 析 下 载 因 子 的 内 涵 必 须 在 同一 
时 间 轴 维度 下 ， 下 载 因子 涉及 数据 是 统计 年 度 前 3 年 ， 


《图 书馆 学 研究 》 《情报 理论 与 实践 》 等 ， 尽 管 下 载 因 
子 是 平均 下 载 量 指标 ， 但 下 载 因 子 较 高 的 期 刊 中 ， 仍 
然 是 载 文 量 较 大 的 期 刊 ， 这 充分 说 明 期 刊 的 知识 信息 
量 对 下 载 因 子 的 影响 较 大 。《 中 国 图 书馆 学 报 》 尽 管 
载 文 量 较 低 ， 仅 有 72 篇 ， 但 下 载 因 子 仍然 排 在 第 七 


位 ， 这 个 成 绩 已 经 十 分 突出 。 


表 2 下 载 因子 及 其 他 相关 指标 


Table 2 Download factors and other related indicators 


期 刊 名 称 下 载 因子 排序 2 年 h 指 影响 因子 载 文 量 /篇 
图 书 情 报 工作 19.552 1 49 5.187 765 
青 报 杂志 14.049 9 42 5.782 463 
情报 科学 9.551 3 30 4.821 357 
图 书馆 学 研究 8.791 4 29 4.470 421 
青 报 理论 与 实践 8.706 5 32 5.163 356 
岗 代 情 报 7.740 6 31 4.382 408 
中 国 图 书馆 学 报 7.260 7 27 15.556 72 
图 书馆 杂志 5.860 8 26 4.242 265 
图 书馆 论坛 5.602 9 26 4.117 266 
图 书馆 建设 5.052 10 24 3.174 311 
图 书 与 情报 4.541 11 26 5.534 148 
大 学 图 书馆 学 报 4.252 12 22 4.736 140 
档案 学 通讯 3.695 13 18 3.418 153 
图 书 情报 知识 3.562 14 23 6.875 104 
档案 学 研究 3.302 15 22 4.123 163 
情报 资料 工作 3.203 16 23 3.565 170 
国家 图 书馆 学 刊 3.090 17 20 4.523 153 
数据 分 析 与 知识 发 现 2.769 18 23 2.887 230 
信息 资源 管理 学 报 0.982 19 13 3.328 67 
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4.2 下 载 因子 与 其 他 指标 的 相关 关系 


考虑 到 影响 因子 、h 指数 、 载 文 量 之 间 相 关 ， 可 能 
存在 多 重 共 线性 问题 ， 传 统 的 回归 并 不 合适 ， 因 此 采 
用 岭 回 归来 进行 回归 ， 该 方法 可 以 有 效 降低 多 重 共 线 
性 问题 。 当 标准 系数 之 和 为 0.4 时 ， 回 归结 果 比 较 稳 
定 ， 因 此 取 此 时 的 结果 作为 回归 结果 。 

log(DF) = c+ 0.494log(H)+ 0.4245 log(IF)+0.259log(P) 

R?=0.940 (4) 

从 岭 回归 结果 看 ， 下 载 因子 中 ， 对 其 影响 最 大 的 
是 有 指数 ， 弹 性 系数 为 0.494， 其 次 是 载 文 量 ， 弹 性 系 
数 为 0.259， 影 响 因子 与 其 相当 ， 弹 性 系数 为 0.245， 
模型 的 拟 合 优 度 较 高 ， 为 0.940。 换 句 话 说 ， 尽 管 下 载 
因子 表面 看 是 一 个 单一 指标 ,但 其 内 涵 信 息 量 非常 丰 
富 ， 既 代表 了 期 刊 的 传播 水 平 ， 也 代表 了 期 刊 的 影响 
力 、 学 术 质 量 和 知识 信息 量 ， 本 质 上 是 一 个 具有 多 种 
信息 的 评价 指标 。 


4.3 下 载 因子 的 统计 学 性 质 


下 载 因 子 的 描述 统计 如 图 3 所 示 。 其 均值 为 6.398, 
标准 差 为 4438， 拥 有 较 好 的 区 分 度 ，Jarque-Bera IEA 
分 布 检验 值 为 12.072， 相 伴 概 率 为 0.002， 拒 绝 正 态 分 
布 的 原 假 设 ， 其 并 不 服从 正 态 分 布 ， 这 和 影响 因子 、 


5 结论 与 讨论 


(1) 滞后 1 年 和 2 年 下 载 频次 决定 了 被 引 频 次 的 
80%。 本 文 基于 图 书馆 情报 与 文献 学 CSSCI 期 刊 的 数 
ERRA, Ha 1 APA a 2 年 的 下 载 频次 决定 了 
被 引 频 次 的 80%， 两 者 具有 很 高 的 拟 合 优 度 。 以 往 学 
者 采用 相关 系数 和 普通 回归 得 出 的 主要 结论 是 下 载 频 
次 与 被 引 频 次 中 低 度 相 关 ， 主 要 是 研究 方法 选择 问题 。 
本 文 开创 性 地 采用 面板 数据 模型 ， 同 时 采用 当期 及 灌 
后 各 期 综合 评估 下 载 频 次 对 被 引 频 次 的 影响 ， 从 而 极 
大 地 提高 了 预测 精度 。 

(2) 下 载 因子 可 以 较 好 测度 期 刊 的 知识 信息 量 、 
传播 水 平 、 影 响 力 和 学 术 质 量 。 下 载 因子 指标 的 时 间 
轴 与 影响 因子 同步 ， 均 为 期 刊 论文 发 表 后 2 EF, ME 
学 术 传 播 水 平 的 评估 。 实 证 研究 结果 表明 ， 下 载 因子 
与 表征 期 刊 质量 影 响 力 的 主要 指标 h 指数 相关 度 最 高 ， 
并 且 与 影响 因子 和 载 文 量具 有 较 高 的 相关 性 ， 拥 有 较 
好 的 统计 学 指标 性 质 ， 是 一 个 内 涵 丰 富 的 期 刊 评价 指 
标 。 

(3) 下 载 因子 指标 有 待 更 多 学 科 和 数据 的 检验 。 
本 文 基于 图 书馆 情报 与 文献 学 19 种 CSSCI 期 刊 研究 得 
出 的 结论 ， 至 于 其 他 学 科 下 载 频次 与 被 引 频 次 的 关系 


总 被 引 频 次 等 许多 引文 指标 一 样 ， 也 不 服从 正 态 分 布 。 以 及 下 载 因子 的 构造 问题 ， 需 要 结合 最 新 数据 开展 进 
Series: DF 
Sample 1 19 
Observations 19 
Mean 6.397820 
Median 5.052357 
Maximum 19.55214 
Minimum 0.981500 
Std. Dev. 4.437751 
Skewness 1.578760 
Kurtosis 5.297573 
Jarque-Bera 12.07194 
Probability 0.002391 


| 
10.0 


2.5 


5.0 7.5 12.5 


15.0 17.5 20.0 


图 3 下 载 因子 描述 统计 


Fig.3 The description of download factor 


2023 年 第 35 卷 第 11 期 


期 刊 下 载 因子 : 传播 、 影 响 


一 步 研究 。 


参考 文献 : 


[1] 


[2] 


[3] 


[4] 


[5] 


[6] 


[7] 


[8] 


[9] 


GARFIELD E. How can impact factors be improved?[J]. BMJ, 1996, 


313(7054): 411-413. 


刘 雪 立 . PHT FRE FEW vr BCR EE. 
中 国 科技 期 刊 研究 , 2012, 23(4): 561-564. 


LIU X L. Establishment of download half -life of sci -tech 
periodicals and its bibliometries significance[J]. Chinese journal of 
scientific and technical periodicals, 2012, 23(4): 561-564. 

许 新 军 . 基于 下 载 量 的 期 刊 


33(6): 117-121. 


半衰期 实证 研究 站. 情报 杂志 , 2014, 


XU X J. Empirical research on half- life period of journals based on 
downloads[J]. Journal of intelligence, 2014, 33(6): 117-121. 
李 晓 娟 . 期 刊 论文 下 载 分 布 特征 及 其 机 制 研究 


情报 科学 , 2016, 34(12): 59-63. 


王 超 , 李 书 宁 


9e 


WANG C, LI S N, LI X J. Research on the frequency distribution of 
journal paper download and its formation mechanics[J]. Information 
science, 2016, 34(12): 59-63. 

SHARMA H P. Download counts - An early indicator for monitoring 
progress of science[J]. Current science, 2007, 92(10): 1323-1323. 
苏 新 宁 . WEA SCHL BLE ARMARRI. KEEA, 


2008, 29(1): 35-42. 


SU X N. Constructing the evaluation system of academic journals of 
humanities and social sciences[J]. Dongyue tribune, 2008, 29(1): 
35-42. 

TER, 郑 晓 南 , 吴 晓 明 . 科技 论文 被 引 频次 与 下 载 频次 的 相关 
EATI. 中 国 科技 期 刊 研究 , 2010, 21(4): 467-470. 


DING Z Q, ZHENG X N, WU X M. Correlation analysis between ci- 
tation frequency and download frequency of scientific papers[J]. Chi- 
nese journal of scientific and technical periodicals, 2010, 21 (4): 
467-470. 

O'LEARY D E. The relationship between citations and number of 
downloads in Decision Support Systems[J]. Decision support systems, 
2008, 45(4): 972—980. 

谢 娟 , EDU, NOS, 等 . 163€ P ch 3 BES | EHEC ZR TOT] 


情报 学 报 , 2017, 36(12): 1255-1269. 


[10] 


[11] 


[12] 


[13] 


[14] 


[15] 


[16] f 


[17] 


MF 


量 的 综合 指标 一 提高 文献 计量 指标 时 效 性 新 的 尝试 


知识 与 信息 Zon 


XIE J, GONG K L, CHENG Y, et al. Meta-analysis of the correlation 
between downloads and citations at paper level [J]. Journal of the 
China society for scientific and technical information, 2017, 36 (12): 
1255-1269. 

BOTTING N, DIPPER L, HILARI K. The effect of social media 
promotion on academic article uptake[J]. Journal of the association 
for information science and technology, 2017, 68(3): 795-800. 
SCHLÓGL C, GORRAIZ J, GUMPENBERGER C, et al. Compari- 
son of downloads, citations and readership data for two information 
systems journals[J]. Scientometrics, 2014, 101(2): 1113-1128. 

胡 敏 . 期 刊 论文 网 络 下 载 规律 及 与 引文 指标 相关 性 研究 加 . 情报 


杂志 , 2012, 31(4): 14-18. 


HU M. The law of journal papers web download and correlation of 
the citation index[J]. Journal of intelligence, 2012, 31(4): 14-18. 

赵 一 权 , 王 振 民 , 熊 文 炳 , 等 . 科学 论文 的 下 载 与 引用 关系 研究 : 
以 ACM 数字 图 书馆 为 例 团 . 中 国 科技 期 刊 研究 , 2014, 25 (6): 


818-823. 

ZHAO Y Q, WANG Z M, XIONG W B, et al. Research on the relation- 
ship between download and citation of scientific papers: Taking ACM 
digital library as an example[J]. Chinese journal of scientific and tech- 
nical periodicals, 2014, 25(6): 818-823. 

BRODY T, HARNAD S, CARR L. Earlier Web usage statistics as 
predictors of later citation impact: Research Articles[J]. Journal of 
the American society for information science and technology, 2006, 
57(8): 1060-1072. 

^F SLUT, 宗 乾 进 , 袁 勤 俭 . 开放 存 取 论 文 下 载 与 引 
R. 中 国 图 书馆 学 报 , 2012, 38(4): 119-127. 


情况 计量 研 


NIU Y X, ZONG Q J, YUAN Q J. A bibliometic study on down- 
loading and citation of open access papers[J]. Journal of library sci- 
ence in China, 2012, 38(4): 119-127. 

ARTER, 段 宇 锋 . ESCA Pacht up e BOUE CS 
Fg Tre dp ROSE DSL. 图 书 


XIONG Z Q, DUAN Y F. Can downloads predict subsequent cita- 


量 ? 一 一 以 


情报 知识 , 2018(4): 32-42. 


tions: A case study on journals of library and information science[J]. 
Documentation, information & knowledge, 2018(4): 32-42. 
COATS A J S. The top papers by download and citations from the 


International Journal of Cardiology in 2007[J]. International journal 


2023 年 第 35 BH 11 期 


83 


84 


农业 图 书 情报 学 报 


DOI, 10.13998/j.cnki.issn1002-1248.23-0757 


of cardiology, 2008, 131(1): el-e3. [19]. Ht fe. 钱 坤 , 唐 祥 彬 . 文献 下 载 频次 与 被 引 频次 的 相关 性 研 
[18] RE, KR, 刘 颖 . 期 刊 下 载 频次 和 被 引 频 次 的 相关 性 研究 究 一 一 以 图 书 情报 领域 为 例 串 . 情报 科学 , 2016, 34(1): 3-8. 
FE HEROA. 数字 图 书馆 论坛 , 2018(10): 25-31. LU W, QIAN K, TANG X B. Correlation analysis between document 
ZHU W, CHEN R, LIU Y. Relationship between citations and the citation frequency and download frequency - In the field of library 
number of downloads of journals: Based on compound H-index[J]. & information science[J]. Information science, 2016, 34(1): 3-8. 


Digital library forum, 2018(10): 25-31. 


Journal Download Factor: A Composite Indicator of Dissemination, Impact, 
Knowledge and Information 


YU Liping" 
(1. School of Statistics and Mathematics, Zhejiang Gongshang University, Hangzhou 310018; 2. Collaborative Innovation Center of 


Statistical Data Engineering, Technology & Application, Zhejiang Gongshang University, Hangzhou 310018) 


Abstract: [Purpose/Significance] The birth of the Internet has brought revolutionary impact on bibliometrics, giving rise to a number of 
online download indicators for academic literature. The most representative basic indicator among them is the download frequency, 
but it also includes the annual download rate, the total download volume, the download half-life, and the Google Scholar Index. The 
proposal of these indicators provides a new method and means of measuring scholarly dissemination and impact, which is a significant 
development of traditional bibliometrics and an important component of alternative metrics. Given the lack of indicators that 
comprehensively characterize the dissemination, impact, knowledge and information volume of academic journals, this paper proposes 
the download factor indicator to address this problem. [Method/Process] First, according to the changes of download frequency and 
citation frequency over the years, based on the citation data of CSSCI journals of library information and bibliology on CNKI, a panel 
data model was used to establish a prediction model of download frequency and citation frequency, and the optimal lag period for 
designing the download factor was determined. The indicator of download factor was proposed, that is, the average number of 
downloads per hundred times of each paper after 2 years of publication. This paper further used ridge regression to analyze the 
relationship between the download factor and the impact factor, h-index, and the number of articles. [Results/Conclusions] The 
download frequency with a lag of 1 year and 2 years determines 80% of the citation frequency. This article innovatively adopts a panel 
data model and comprehensively evaluates the impact of download frequency on citation frequency in both current and lagged periods, 
thereby greatly improving the prediction accuracy. The download factor can better measure the knowledge information volume, 
dissemination level, influence and academic quality of the journal. The timeline for downloading factor indicators is synchronized with 


the influencing factors, both within 2 years after the publication of journal articles, focusing on the evaluation of academic 
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communication level. The download factor has the highest correlation with the main indicator of the impact of journal quality, the 
h-index, and has a high correlation with the impact factor and publication volume. It has good statistical indicator properties and is a 
comprehensive indicator for evaluating journals; the download factor index needs to be more inspection of application in disciplines and 
use of data. This article is based on the conclusions drawn from the research of 19 CSSCI journals in library and information science 
literature. The relationship between download frequency and citation frequency in other disciplines, as well as the construction of 
download factors, require further research in conjunction with the latest data. 
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